批量學習在運作時會一次使用整個數據集進行訓練,模型的各種數值參數都會在一次訓練中更新,而不是逐個樣本進行訓練。批量學習通常是在離線下進行的,所以又叫做離線學習(Offline Learning)。這種學習方式的模型相較在線學習更穩定,因為訓練是事先完成的,且對數據比較敏感。如果要讓他能夠預測新資料,則必須加入新數據集整個重新訓練一次。
通常會用在穩定性要求高、需要離線訓練的況下。
這種訓練方法與批次訓練不同,在模型的訓練中能夠不斷地接收新數據,對模型及時更新,而不需要用到整個數據集。這種學習方法特別適合處理數據流,在數據流中資料不斷生成,而線上學習模型能夠不斷的適應新數據,無須將數據一次儲存下來。
常用在需要模型能夠隨new data不斷進化,或者是能夠及時處理資料並給予反饋的情況,例如在網路中檢測是否有異常活動。
批量學習是用固定的一個數據及訓練,而線上學習是不斷地接收新數據。批量學習在一段時間後就必須加入新數據重新訓練以保持預測準確性,會耗費十分大量的資源,而線上學習則能一直學習。
線上學習中雖然能不斷接收新數據,有著很好的適應性,但這也代表有可能接收到有問題的資料,若是發生這種狀況,模型將會直接受到影響。而批量學習雖然不靈活,但卻比較穩定。